2024/12/30

價值觀有優劣嗎?從道德發展階段理論談起


話先說在前頭,Kohlberg 在 1958 年所提出的道德發展階段,後續受到很多的挑戰,也不是當前學術界的主流觀點。但相較於新近的道德心理學研究,Kohlberg 的理論有其時代特色:結構主義。簡單的說,就是他的理論提供了一個明確的形式與方向:人的道德觀區分成若干階段,從個人到社會,從幼小到成年;言下之意就是:從劣到優。

時至今日,我們自然不必完全服膺他的理論,但 Koberg 提出的架構依然有其參考價值。他的理論把人的道德發展分為六個階段:

  1. 服從與懲罰定向(避罰服從:「我會不會挨罰?」)
  2. 利己主義定向(相對功利:「對我有何益處?」)
  3. 人際和諧與一致(尋求認可:「會不會丟臉?」)
  4. 維護權威與社會秩序定向(社會法制、法律與秩序:「是否合法?」)
  5. 社會契約定向(「法律/規則是否公平?」)
  6. 普遍倫理原則(原則與良心定向)

前三個階段的劃分,受到的批評比較少,因為這段發展基本上反映了人類從生物本能走向社會化的歷程。

而後面的階段就飽受攻擊,有人說他只強調正義,忽視其他的價值,沒有充分顧及到其他道德層面。也有人批評他的理論單純基於白人男性觀點(他的實驗初期只有男性受試者),Gilligan 以女性的觀點提出了「關懷倫理學」,來修正 Koberg 的理論。Gilligan 將 Koberg 的「三期六階段」簡化:

  • 前成規期:個人生存
  • 成規期:自我犧牲為善
  • 後成規期:非暴力原則(不得傷害他人或自己)

相較於 Koberg 試圖指出「正確的發展方向」,Gilligan 的論述更像是畫出「道德的底線」,的確是相當不同的觀點。

Koberg 的道德發展階段後續發展出一些相關的心理測驗Defining Issues Test, DiT),而關懷倫理學後續也有更多細緻的論述。但新近的道德心理學研究,則較聚焦在神經科學的發現,探討個人的道德敢試怎麼來的。有興趣的讀者,可以參考最近謝伯讓老師在廣播節目裡的介紹


之所以想到要寫這個題目,主要是深深的感受到整個世界氛圍的分化與對立。

每個人都是自身經驗的囚徒,所以每個人都會有獨有的價值觀,每個人心目中也有各自以為的正義。而很可悲的,我們每個人也都覺得「我的正義比你的正義更正義」,「我的價值觀比你的更高尚」。這是人性。

社群媒體連結了大家,但同時也強化了對立:當我可以很容易的找到跟我觀點像似的人(同溫層),我就更容易強化自己的信念,更勇於表達自己不同的想法,同時,很不幸的,也更不願意聽見不同的聲音。

那麼,接下來就是行為的選擇了。如果我的正義比你的正義更正義,如果我的價值觀比你的價值觀更高尚,我是不是就可以鄙視你、侮辱你,甚至傷害你?

行為的底線在哪裡,大抵上決定了文明發展的程度:沒有底線,那麼我們就跟生物界的弱肉強食無異;能夠做到不互相殺害,那麼物種就有了繁衍成長的機會;彼此傷害的程度降低、協作複雜度提高,基本上是我們從茹毛飲血到今日繁華所依循的路線。

我不知道這個路線是不是就是最高尚的,但我只能說,我期待大家至少能守住「非暴力原則」這條線,不然我們的文明發展恐怕很快就要到盡頭了。

2024/12/23

No Stupid Question 結束了


最近一個蠻喜歡的 podcast ,No Stupid Question,在他們的第 222 集開頭,兩位主持人宣佈節目要結束了。沒說什麼特別的理由,只是「就像所有美好的事物一樣,都有結束的時候」。

從現在開始,會從第一集開始重播。

節目的主持人有兩位。女性主持人 Angela Duckwarth,是暢銷書「恆毅力」(Grit)的作者;男性主持人早期由「蘋果橘子經濟學」(Freakonomics)的作者 Stephen Dubner 擔任,後期換成體育分析師 Mike Maughan。中間似乎有短暫的另一位女主持人,但是已經不記得名字了。

這個節目大約是疫情期間開始的(2019年底),我自己是因為原本就在收聽 Freakonomics Radio 的節目,多了一個節目,我也就自然而然的開始收聽。

對我來說這個節目的主要亮點是選題,製作團隊真的是什麼問題都談,而且談的很有內容。 Angela Duckwarth 除了身為心理學家,在節目中經常性的引用大量相關的科學研究之外,也常常提到自己作為亞裔移民第二代在美國的生活。

雖然少了一個週末接送家人時可以聽的節目,好像也不是真的有什麼大不了,就是有個時間戳記,告訴我們從新冠疫情開始,已經五年了。

最後,附上 Angela 的 TED 演講。


2024/12/19

抄經與超能力

 


高中那段迷惘的歲月裡,我養成了抄經的習慣。

我個人並沒有特定的宗教信仰。從小家裡是一般的傳統民間信仰,就是從祖先、關公到媽祖、七爺八爺三太子,誰靈驗就都拜一拜的那種,並不是嚴格意義上的宗教。

成長的過程中除了逢廟就拜之外,有遇過外國來的傳教士,有基督徒朋友拉我上教堂,有親戚信仰佛教拉著我去靜坐誦經。坦白說,並沒有哪個宗教特別覺得讓我覺得「靈魂受到觸動」。

或許根本原因是我其實也沒有靈魂吧?


開始常態性的背誦跟抄經心經,是起始於在圖書館裡翻到某本教人如何獲得超能力的書。

書名我已經忘了,總之就是40年前那種不知道有沒有取得授權的日文翻譯書。我只記得封底的作者照片留著一臉大鬍子,跟後來在東京地鐵沙林毒氣事件的新聞裡,那位奧姆真理教的教主頗有幾分相似,但也已經無從查證了。畢竟經過1994年的「612大限」之後,台灣的市面上大部分無版權的書籍都消失了。

我還記得書裡記載著很多種奇怪的「功法」,有些接近一般宗教的修行,有些看起來就讓人缺乏嘗試的動機。例如,我印象最深的一則方法是:「拿棉線從一個鼻孔穿進去,再從另一個鼻孔穿出來,然後左右拉動,直到習慣為止」。我直到現在連想想都覺得痛,完全生不起要去驗證的念頭。總之,我評估安全性之後有真正去嘗試的,大概就只有「冷水淋浴」跟「誦讀心經」兩項。

當年雖然沒有網路跟維基百科,但在宮廟林立的台灣,要拿到一份般若波羅蜜多心經,倒是一點也不困難。不到三百個字,又是按照意思翻譯,背誦起來難度也不算太高。當時撕了一頁放在口袋裡,邊走路邊背,忘了就拿出小抄來看,沒多久就背起來了。讀高中的時候,每天通勤要搭單程二、三十分鐘的公車,常常沒辦法拿出書來讀,無聊的時候就在心裡默默念誦。當時還有計時,發現最快可以30秒唸誦一次。

後來決心要好好準備大學聯考那段期間,除了通勤時念誦之外,每天早起跟睡前都外加手抄一次,作為一種儀式。這倒不是因為宗教信仰的因素,而是覺得如果在聯考之前可以獲得一些超能力,應該會是很大的優勢。(是的,當時就是這麼的中二,喔,不,是高三。)

結果呢?我必須誠實的說,這三十多年來雖然常有間斷,但我念誦心經沒有百萬也有數萬次,手抄經文至少有上千份,而冬天洗冷水澡這件事,則是40歲以後就不為難自己了。時至今日,我沒有發現自己有任何的超能力,但抄能力好像是有一點。

我嘗試做「用意念控制燭火方向」的實驗來證實「有沒有超能力」這件事情。如果純憑感覺,可能還真的會誤以為自己好像有點什麼,但是一旦加上 counter-balance 的實驗設計跟統計檢定,就立刻否定了我具備「能用意念操縱燭火搖動方向」的可能性。

我倒不是說這些方法一定無法讓人具備超能力,我個人實驗的證據,也只能推論說「以我的資質與努力程度,三十年下來沒有得到任何成果」,或許可以給有興趣的嘗試的人做個參考。可能我再繼續個二十年,或是改抄聖經或可蘭經,以後哪一天突然就成功了也說不定。


關於抄寫經文,另一件傷腦筋的事情,是這些紙要怎麼處理。二十多年前要出國讀書的時候,不知道該拿那上千張紙怎麼辦。當時查詢了比較正統處理方式,是要進行火化,做些儀式已是尊敬,所以我連燒金紙的設備都準備好了。但當時轉念一想,資源回收好像也蠻政治正確的呀,所以我就很乾脆的整疊裝在袋子裡交給清潔隊回收了。不知道那些經文現在是焚化了、埋在地下,抑或是做成再生紙繼續在世界上循環著?如果是最後一種,似乎也是不錯的結果。


會寫這篇文章,其實是因為最近又開始了抄經的儀式。

起因是由於整理家中跟工作場所的文具,發現很多不知道還有多少墨水的筆,以及還有空白頁的筆記本。這些年生活走向數位化,拿筆寫字的機會很少,想說這些紙筆好像沒有什麼用到的機會,但直接丟掉又有點可惜,那就拿來消耗一下好了。說不定當這些紙筆用完之後,我就有超能力了呢!

好啦,不說笑了。一如前面提到的,我沒有特定的宗教信仰,但是「背誦與抄寫一段特定的文字」,對我而言是一個很有效的「讓思緒平靜下來」,以及進入「集中注意力」狀態的儀式,也因此我上大學之後依然保持著這個習慣。剛出國讀書那段日子,我還嘗試過挑戰「大悲咒」的背誦跟默寫,但音譯的經文難度實在太高,佔用太多的認知資源,反而達不到在短時間內「屏氣凝神」的效果,後來也就不了了之了。

接下來,或許會試著抄寫其他宗教的經文或名著片段,看看再過30年會如何吧!


2024/12/17

「智慧有限」模式的進階應用

 


之前介紹過一個自製的「智慧有限」專案,同樣的工作流程,透過現有的 AI 服務供應商,似乎是彈指之間就可以完成複雜的工作。

這篇的例子,是我到 Yahoo奇摩新聞的網頁,點選「熱門留言文章」的第一名(「賣一斤賠一斤」感歎年難過),把文章丟進 ChatGPT 讓它幫我寫成歌詞,然後再把歌詞貼進 SUNO 的歌曲生成服務。生成完後稍做修改,下載歌曲影片然後放上 YouTube,就完成了。

執行這整個流程,總共不到10分鐘。雖然過去幾年的自製方案,也可以做到全自動完成這件事情,但成品的品質有蠻大的差距。我只是深深的感覺到,這幾年自己訓練模型是在訓練心酸的,不過至少我也親身參與到了這段技術的發展過程。

之前「智慧有限」完成之後,我就開始做音樂生成的模型,走的是階層式樂譜生成的路線。但當 SUNO 以一騎絕塵之姿出線之後,我就很乾脆的認輸了。正如之前說過的,點子人人都想的到,有人比你聰明、又比你有資源,執行力還比你強,很乾脆的認輸,又有何不可?

2024/12/10

公主徹夜未眠

小朋友正處於每天晚上都抱怨睡不著,然後忽然就睡著了的年齡。

前幾天他在抱怨說睡不著的時候,恰好在播放杜蘭朵公主裡的「公主徹夜未眠」,我跟小朋友說:「沒關係呀,杜蘭朵公主也跟你一樣睡不著呢!」

雖然對這段旋律很熟悉,但其實我不是很記得這首詠嘆調是在唱什麼內容,以及公主為什麼不睡覺。於是去查了維基百科,嗯,難怪我不記得,這劇情實在是太... 讓人難以記住了。

茲將歌詞及翻譯摘錄如下:



Nessun dorma! Nessun dorma!

無人得以入睡!無人得以入睡!

Tu pure, o Principessa!

妳也一樣,公主殿下!

Nella tua fredda stanza.

在妳冰冷的寢宮,

Guardi le stelle che tremano d'amore e di speranza.

仰望那些因為愛與希望而顫抖的繁星。

Ma il mio mistero è chiuso in me,

而我的秘密深藏於心,

Il nome mio nessun saprà!

無人能知我的名字!

No, no! Sulla tua bocca lo dirò, quando la luce splenderà!

不,不!當晨光照耀時,我會在你的唇上揭曉謎底!

Ed il mio bacio scioglierà il silenzio che ti fa mia.

我的吻將打破妳的沉默,使妳成為我的人。


Il nome suo nessun saprà...

無人能知他的名字…

E noi dovrem, ahimè, morir, morir!

而我們都將難逃一死!


Dilegua, o notte!

消失吧,黑夜!

Tramontate, stelle! Tramontate, stelle!

下沉吧,星星!下沉吧,星星!

All'alba, vincerò!

黎明時,我將勝利!

Vincerò! Vincerò!

我將勝利!我將勝利!


然後附上 Luciano Pavarotti 的經典版本:

2024/12/07

柏拉圖式表徵假說(Platonic Representation Hypothesis)

https://arxiv.org/abs/2405.07987

這兩年生成式人工智慧gnerative artifitial intelligence)的發展迅速,各種文生文、文生圖、文生音樂的應用,像雨後春筍一樣不斷冒出來。

目前的語言模型language model)的運作方式,雖然依舊是處理「符號序列」的建模與預測,但已經脫離字符層面的「猜下一個字是什麼」,而是把文字符號轉換成一個抽象的、更接近於「辭義」的符號,繼而演變為對這個「意義序列」的建立模型,並且以此來預測「下一個意思是什麼」。

這個從「文字符號」轉換到「意義」的工具,專業術語叫做「詞嵌入」(word embedding),對現在這一波 AI 浪潮而言,也算是很重要的基石之一。

在這裡我無意去討論這個轉換的技術細節,只能簡單的陳述這屬於「表徵學習」(representation learning)的研究範疇。而其實很多人都想到了,相同的「轉換」概念,可以應用在文字以外的資料型態上,像是影像或是聲音訊號,把它們都轉換成某個「潛空間」(latent space)裡的向量。

於是,我們看到了像是 MidJourneyStable Diffusion 這類「文生圖」(text to image),SUNO 這種「文生音樂」,或是 SORA 這種「文生影片」的服務。

這些服務的出現,其實背後隱含了一個意義:無論是文字、影像,或是聲音,在某個抽象的數學空間裡,它們的意義,或者說是表徵,是可以互通的。在 ChatGPT 發布的前一個禮拜,我恰好在某個研討會上提出了這個觀點,不過表徵學習在 LLM 興起之後,就不是那麼多人在關注了。

而前不久,一篇 MIT 的研究論文深入的討論了這個現象,作者們稱之為「柏拉圖式表徵」(Platonic Representation):柏拉圖實在論觀點裡的「理型」(ideal form)。作者們提出一個假設:當各種 AI 模型足夠大、資料足夠多的情況下,最後都會收歛到相同的一個潛空間。我個人雖然樂於支持同樣的觀點,但目前論文裡提出的證據似乎還不夠充分,也只能暫時以「假說」視之了。

有興趣的讀者,可以試著讀讀論文原文,或是看看中文解說影片


2024/12/06

尋找 (with suno)


2024年三月某天中午用餐的時候,鄰桌的三個小妹妹突然拍桌子大叫「花心!」嚇了我一跳。

原來他們是在討論手機裡的男生照片,其中一位是「台大的,但是他就是很典型的射手座...」然後,才發生了拍桌子的一幕。

於是,我請 suno 幫那位假設是被誤解為很花心的男生寫了一首歌,算是幫我的射手座男性朋友們平反一下...

[Listen on SUNO]

2024/12/05

[回憶] 我們從何處來?我們是誰?我們向何處去?

 

https://zh.wikipedia.org/zh-tw/%E6%88%91%E4%BB%AC%E4%BB%8E%E4%BD%95%E5%A4%84%E6%9D%A5%EF%BC%9F%E6%88%91%E4%BB%AC%E6%98%AF%E8%B0%81%EF%BC%9F%E6%88%91%E4%BB%AC%E5%90%91%E4%BD%95%E5%A4%84%E5%8E%BB%EF%BC%9F

附圖是高更在1897年的畫作,《我們從何處來?我們是誰?我們向何處去?》(法語:D'où venons-nous ? Que sommes-nous ? Où allons-nous ?

「我是誰?我從哪裏來?我到哪裏去?」這是我們遲早都要面對的問題。想了不見得會有答案,每個人的答案也不盡相同,但是,這些問題似乎無可迴避。

我14歲那年的6月某日(總之不是4日當天),早上起來看到電視新聞裡,大學生站在坦克車前面的畫面。那應該是我開始思考這些問題的起點,至少我是這麼記得的。

然後,我開始反抗父母的安排。從讀得好好的私立學校轉學,不想讀傳統定義的「好學校」,休學、重考、復學。復學前有半年左右的空檔,以及復學後的大部份假期,我都窩在圖書館,把1開頭的書幾乎都翻了一遍。

我沒有找到這些問題的答案。

然後,台灣的出版界開始引進「科普」書籍,讓我見識到了哲學、文學以外的,另一種認識世界的方式。當我把「時間簡史」翻了兩三遍,發現完全看不懂之後,我決定轉到自然組,因為「物理學好像沒辦法多看幾次就看懂,得要有人教才行。」

基於前面寫過的,高中時期的荒唐行徑,我知道自己在學業上落後同儕很多;所以,我放棄了跟隨學校、師長幫大家擬定的準備聯考的方案(複習進度、模擬考... 等等),轉而自己訂了一套從零開始的學習計劃。我不知道這麼做到底行不行得通,但我很清楚自己的程度:我什麼都不會,只能從頭開始。

最後的半年裡,我把考試範圍的高中的課本從頭到尾讀了一次,當然時間也只夠我讀一次。後來,我只能猜測,在大規模高強度的無差別閱讀之後(聽起來很像 LLM 的 pre-training),國立編譯館所編的教材是屬於很容易吸收的內容。至少,自己從閱讀資料中學習的能力,就這麼陪伴我走到今天。


時至今日,我也不敢說找到了這三個問題的答案。不過,在人生的每個階段,身邊都有朋友陷入對這些問題的思考,有人生不順遂導致的,也有功成名就後的空虛引發的,也有單純年紀到了的。從經驗看,或遲或早,每個人總是要被這個問題困擾的。而我還蠻慶幸自己在很小的時候就發作,頂多就是傷害了某些老師的自尊,或是辜負了某些長輩的好意,沒有造成什麼難以挽回的悲劇。有些朋友,就沒這麼幸運了。

如果說我有從這段經歷中學到什麼,應該是:真正讓我們長大成人的,不見得是這三個問題的答案本身,而是追尋的過程。我們怎麼尋找問題的答案,過程中付出什麼,放棄什麼,怎麼質疑或接受每個可能的解答,以及在何處安頓。這些種種,才真正的定義了我們是誰。


好啦,才50歲,不要一直回憶過去,該繼續面對未來了。

2024/12/04

[回憶] 尋夢與問津


亦耕,洪邦棣老師,是我高中復學之後的班導師。其實我已經記不太起老師的本名了,但書架上還有老師的書,「尋夢與問津」,也就不難找到一些過往的痕跡。

當時洪老師對我諸多關照,鼓勵我透過書寫這段經歷,來走出休學的陰影。雖然我好像直到現在都沒有照做,但以諮商輔導的角度來說,這的確是相當好的建議,尤其是當建議你寫的人本身是作家的時候,那是相當正向的體驗。

回想起來,當時幾位同學特別喜歡找我出去玩,大概也是洪老師的囑咐吧。不過那時我跟幾位編校刊的同學不是那麼投機,反而是跟幾位體育保送生比較處得來。或許是當時我很不喜歡開口講話,跟這些開朗、自來熟的人相處起來比較沒有壓力。

說實話,我自己的文字風格,跟洪老師比較不是同一條路線;雖然也嘗試過模仿這個風格,但總覺得哪裡不對勁。我自己書寫起來比較像是碎碎念,講了一個正面的想法,就非得再提一個反面的說法,叨叨絮絮,囉哩囉唆。

如果說活了五十年,真的有學到些什麼的話,大概就是人還是不要太逆著自己的本性行事,順性而為才有機會真的自由。我這個風格呢,寫寫科學論文跟研究報告還挺合適的,而現在有了 LLM 輔助,「看得出好壞」的能力,大概又比實際書寫風格來得重要了。

2024/11/28

[回憶] 把數學課當文學課的日子

 

這篇應該算是懺悔文吧。

高中有一段時期,上數學課時完全沒在聽課,都在看小說。有一次,數學課,我在看「生命中不能承受之輕」,看不太懂,以至於老師叫我我完全沒聽見。於是,我就被罰站了。

那個時候,我大概是連狗都嫌的樣子吧,站著還在繼續讀小說。最後老師忍不住了,把剩下短短一小截的粉筆朝我丟過來。

老師準頭很好,丟到我桌上,沒丟到我。好球,有大將之風。

我也沒什麼反應,繼續思索剛才讀的那段倒底是什麼意思、該怎麼詮釋,最後老師決定放生,叫我坐下。

這樣的情況大約持續了一年吧,那段時間我的數學完全是一片空白,每次小考都直接交白卷,有一次考卷發回來得了三十分,我大感不解,一看原來是隔壁班改考卷的同學看不下去,幫我寫了一題,還寫了一段話勸我不要這樣。

當時會這麼做,當然有很多理直氣壯的藉口,但30多年過去了,這些藉口現在看來也都很可笑,我也只能在心中說聲抱歉了。有幾位目前在當高中老師的朋友,當他們抱怨學生不認真讀書、學習的時候,我就告訴他們我當年的荒唐行徑,安慰說:「有沒有覺得你的學生其實還蠻可愛的?」


或許,我後來做計算語言學跟語言模型,試圖把文學變成數學,一部份也是潛意識中想彌補當年把數學課當成文學課的歉疚吧。(聽起來很牽強,我自己都不太相信 XD)

2024/11/26

[回憶] 打掃廁所,與更重要的事情

我很少對人當著面撒謊,更少是明知對方知道我在撒謊的情況下繼續胡說,所以這件事情我一直都記得。

時間是高三下學期,到學校上課的最後一天,所以應該是 1994 年五月底或六月初。

到了學校,我一如既往拿著打掃工具,到指定的區域打掃。

那個學期我們被分配到打掃廁所。90年代公立學校的廁所設備蠻糟糕的,個別學生的使用習慣我就不評論了,主要是設備老舊,偶而還會污水逆流:你沖水要清潔馬桶的時候它反而向上噴,可謂是... 我找不到形容詞。總之,這並不是怎麼受歡迎的工作。

畢竟是高三下學期了,這個「打掃廁所」的工作,很多人本來也就是過來走一圈做做樣子,真的有在從事清潔工作的也就是那麼三、四個人。隨著大學聯考的逼近,大家都有「更重要的事情」要做,所以來參與打掃工作的人數也就慢慢下降,到了停課前的最後幾天,大概就只剩那幾位原本就有在打掃的同學會出現。

最後那天,我記得只有我一個人。

因為只有一個人,所以全部打掃完比預計多花了點時間。就在我邊收拾工具,邊感嘆「總算撞完了最後一天鐘」的時候,突然有人從背後叫我。

是訓導主任。

「只有你一個人來打掃?」

(廢話,你是第一天在這裡上班嗎?你會不知道這間學校學生是什麼樣子的?)

「喔,沒有啦,同學們打掃完先回教室了,我最後收一下工具而已。」

(對,我說謊,你知道我說謊,我也知道你知道我說謊,怎樣?要我寫悔過書嗎?)

訓導主任深深的瞪了我一眼,看了看我的學號姓名,沒說什麼,掉頭走了。

然後,就沒有然後了。


每個人都有自己重視的事情,大家依據自己主觀認定的重要性,來安排資源配置的優先順序,這是人性,原本就沒有什麼對錯之分。

當時的聯考,或者該說是廣義的升學主義,其實是傾整個社會之力塑造一個共同的價值:有好成績、考上好大學最重要,其他的一切在這件事情前面都可以被忽略。在這個價值觀下,學生們如果覺得「環境整潔不是我的責任」,那也只是剛好而已,不是嗎?

三十多年過去了,社會風氣其實改變了很多,但整體上「奉行單一價值」的傾向還是蠻強烈的,不知道是不是文化底層的因素。前兩天看到羅鎮宇分享他對中國「高考模式」的看法,又想起了這件往事,也算是有感而發吧。


後記:看到 AI 生成「高中生打掃廁所」的圖,想到如果是男女合班的話,不打掃的情況應該會自動降到最低限度。我們真的應該善用人類的生物本能,輕推就好。

2024/11/22

高中畢業30年


前陣子一位國中小我一屆的學弟突然私訊我,問我高中是不是X班畢業的,我們的班召集人在找人,然後給了我一個 Line 群組連結,我想了想,也就加入了。

其實我是真的不記得我是哪一班畢業的,主要是我高中唸過四個班,加上那段時期我的人生非常的迷茫而且思緒混亂,要明確的記得每個事實著實有點困難。

看著群組裡同學們熱烈的討論,我發現自己對那段歲月的印象真的很模糊。

高中歲月,我還記得些什麼呢?

我還記得的是入學時候的班級,休學後復學班上的幾位同學,有常常上新聞的,有拉著我到處參加活動的。我也還記得社團的幾位學長,他們算是我對 LGBTQ 概念的啟蒙;還有目前是知名網紅的社團學弟,其實也是他到處說他高中是什麼社團的,我才想得起來,畢竟他入學的時候我在休學,我復學之後不久又輪到他休學,要不是有一次年度公演的共事,我還真的完全沒有印象。當然我還記得幾位老師,這所學校的老師們都蠻有特色的,這個我另外再寫一篇好了。

我入學的時候是社會組,高一下學期休學一年,復學之後跟圖中兩位執行編輯同班。高二下學期從社會組轉到自然組,就又換了班級,但我反而是對這些相處最久(一年半)的高中同學印象最少,想想真是有點內疚。我比較有印象的,是有一群住桃園的同學每天一起趕火車、趕補習班,然後有參加不同補習班的同學們每次考試完會互相比較。或許是因為這些活動我都沒參加,所以缺乏可以提供回憶的線索吧?

總之,當時我幾乎跟任何人都是一種保持距離的狀態,連體育課都是一個人繞著操場跑步,要說我是社交恐懼或是生性涼薄,大概都說得通吧?

不過呢,我倒是想起了我的學號,這串數字不知道是為什麼藏在腦海的角落裡,突然就蹦了出來。90173,這提醒了我,我比這些要30年重聚的朋友們大了一屆。這樣一想,或許是當初多少有點感到自卑,才保持距離的吧?

無論如何,還是祝福這些同學們,對接下來的人生心想事成,也持續充滿熱忱。





2024/11/21

我的 AIPC 體驗

這篇不是業配文,只是單純的個人使用心得。

夏天的時候換了新筆電(Asus Zenbook S16),主要是工作上大量使用 LLM,想測試看看所謂的 AIPC 到底有沒有用,而選這台的理由有兩個:第一,這台是 AMD Strix Point 筆電處理器的首發機種之一;第二,這台是第一台採用「陶瓷鋁合金」(Ceraluminum)做為外殼材質的機種,而個人過去跟這個材質的開發有那麼一點點淵源。

這台筆電的評測網路上很多,好的普通的都有,我就不贅述了。而新設計的機種,前期在穩定性上難免有些小問題,尤其是入手第二個月的幾次 windows update 都直接讓 wifi-7 晶片失去作用,電源管理的穩定性也常常出錯(睡著叫不醒),好在現在 ASUS 出補釘的速度也很快,在火燒起來之前就先滅了。

整體來說,作為一台筆電,我很滿意。

至於 AI 的部份,兩個月之前測試,發現本地部屬語言模型常用的 ollama 跟 llama.cpp 都還沒有正式的 NPU 支援,生圖的 ComfyUI 跟 Automatic1111也是。當時覺得要用到 NPU 似乎只能自己寫 code ,似乎離一般消費者有點太遙遠了。
本來覺得只能等微軟的 copilot+ 了,結果昨天發現 AMD 跟 LM Studio 是直接合作,在七月就出了 ryzen-ai 專用版。轉念一想,那生圖的應用是不是也走這個路線?果不其然,amuse-ai 也已經出來一陣子了。
這樣我似乎有點理解 AMD 的策略了。 Intel 的 NPU 其實很早就開始做了(多年以前有推一個 USB 界面的「加速棒」就已經是這個概念了),但一直都是極小眾的利基市場,而 core-ultra 也早了 AMD 半年多推出,AMD 如果推廣一般性的 NPU 支援,難免有為他人作嫁的感覺。但如果是綁著自家函式庫的專用版軟體,那故事就完全不一樣了,畢竟 CUDA 也沒為我家 GPU 提供支援,我何必支援別家 NPU?
好吧,商業競爭嘛,落井下石也難免,再說當初擬定這樣的策略時,對方還沒有病得這麼重呢,也不好說是「趁你病要你命」。
不過截至目前似乎都沒有看到有廠商很積極的在推廣 LM-Studio-with-Ryzen-AIamuse-ai(也許是怕擋到微軟推 copilot+ 的財路?)。這些軟體都找得到測試影片,建議賣 AIPC 的商家可以直接拿來宣傳,已經買了 AMD Strix Point 筆電的使用者也可以自己安裝。

附註:這些「加速」都只是加快 inference time,要訓練模型還是乖乖用 CUDA 吧

2024/10/28

魔術方塊

 

開車的時候,小朋友要我趁紅燈的時候把魔術方塊復原,我一看已經轉得亂七八糟,便回答要等回家了才能把它復原。

回家後,去查了公式,然後開始動手,轉著轉著發現出現了不可能的情況。小朋友笑著說,他看網路影片,單層轉到45度角的時候,可以抓住一個角旋轉,他不記得轉了幾次...

小時候做家庭手工,曾經做過一陣子的魔術方塊,習得一個特殊技能:直接把魔術方塊解體重組。我輕鬆的把魔術方塊拆開,正在得意的時候,又發現了不應該出現的狀況:一個三面角有兩個面是同一個顏色。

這種情況只有一個可能,我問小朋友,是不是有把貼紙撕下來交換位置,他說有啊,不可以嗎?

無言。於是我也只得把有錯誤的貼紙撕下來重貼,然後恢復原狀。

這倒是讓我想起許多往事,像是40年前做家庭手工貼的貼紙品質不是很好,一旦貼錯,撕下來很容易就破了,只能報廢。現在的產品倒是不會有這個情況。

堂哥說當年做300個工錢才60元,我是完全沒印象了,但當年那些化學溶劑、塑膠、貼紙的氣味,反倒像是還留在鼻尖,依稀可聞。


阿祖的山刀


大學的時候參加登山社,有時候需要用到山刀,當時還沒有什麼網路購物,就向祖父詢問附近哪家五金行有在賣。

祖父問明了我要買開山刀的緣由(確認不是要去砍人),轉頭進了房間,然後拿了一把黑黝黝的刀給我:「免去買呀,這支系恁阿祖自己做的,用了要也記得還我喔。」「恁隴毋哉,恁阿祖挖熬耶,當初種田,犁田的工具、柴刀,攏馬係伊嘎己做耶... 」以下省略數百字。

祖父話不多,有關曾祖父的往事,大概是少數可以讓他打開話匣子的事情。

祖父過世之後,山刀不知道被哪位親戚收藏了,圖上是造型相似的刀品,但既然是商品照片嘛,長相自然比當初那把山刀好看很多。

印象中,祖父還有一把武士刀跟散彈槍,也是我小時候幫忙顧雜貨店時偶然發現的。這個,就留待後話吧。

2024/10/19

點子值不值錢

年輕的時候,覺得點子很值錢,常常覺得:「我這麼聰明,有這麼好的想法,肯定沒人想得到」。

隨著年紀漸長,慢慢發現世界上跟我一樣聰明、甚至比我更聰明的人,比比皆是。我想得到的點子,別人一樣想得到,屢試不爽。

尤其在一些熱門領域的創造、研發,凡是想到一個深思之後覺得值得進一步探究的點子,最好是假設世界上有另外五個團隊也想到了一樣的點子,而且其中至少有一個比你聰明、一個比你有資源、一個既比你聰明又比你有資源。

所以,要不然就是馬上動手做,要不然就是等著看別人收穫成果。但是即便你立刻著手進行,那些比你有資源或能力更強的團隊還是可能比你快。

所以,點子值不值錢?不能說不值錢,但是要「變現」還需要很多的努力,沒有強大的執行力做後盾,恐怕就只是空歡喜一場。

2024/10/07

「世界上所有的知識」該如何表示?「人物設定+語言模型」可以嗎?

https://huggingface.co/papers/2406.20094

隨著語言模型越來越大,需要的訓練資料也越來越多,我們面臨著「資料不夠用」的窘境;而許多研究也指出,如果直接使用語言模型生成的資料來訓練語言模型,會造成意料之外的問題(Will we run out of data? Limits of LLM scaling based on human-generated data)。

Tencent AI Lab 前陣子發表了一篇技術報告,Scaling Synthetic Data Creation with 1,000,000,000 Personas,雖然說是打著「生成高品質內容」的招牌,但個人覺得更有趣的是他們的一個觀點:透過10億個不同的人物設定,搭配大語言模型,可以視為對全世界的所有文字資訊的一種壓縮。(如圖)


個人對「表徵學習」(representation learning)這個研究主題很有興趣,主要的原因是這件事情反映出我們對「外在世界」的理解、詮釋與建構。我相信「每個人的觀點都不盡相同」在現代社會是屬於常識,但這些觀點的形成與運作方式,在人類這個群體裡,甚或是與其他物種之間,是否有共通之處,則是解答「人之所以為人」的有趣課題。

我個人覺得這個 Persona-Hub 的有趣之處,在於對「如何表徵知識」提出了別出心裁的觀點:人物定加上語言模型。這跳脫了傳統上以「某個潛空間latent space)的向量」作為表徵的限制,而採取「兩個潛空間(人物跟語言)的捲積」作為新的路線。而在數學上,能從「一個」跳出來,「兩個」其實就意味著「多個」,那就為這個問題開啟了一扇新的門。


這篇研究報告採用的方法也相當有趣,10億個人物設定的一部份也公開在 GitHub 上,這對需要大量使用人物誌的單位來說,應該是個不錯的應用案例。

2024/10/02

是的,我是「LLM 通往 AGI」的唱衰者

 

其實我一直都不覺得大語言模型(LLM)會通往通用人工智慧(AGI),但這顯然不是主流媒體的說法,尤其是每次 OpenAI 推出什麼「新奇」的產品時。
目前 OpenAI 最新的產品是 o1,主要是加入了一層 CoT (Chain of Thoughts),大幅提昇「透過逐步拆解來解決複雜問題」的能力。推出之後很多人拿來玩各種考試,幾乎都是高分通過。熱心網友拿前幾年台灣的大學入學測驗來測試,結果分數高達 PR88,分數足以上絕大多數的系所。

然而,這也不是故事的全貌。

介紹兩篇研究:

‘In awe’: scientists impressed by latest ChatGPT model o1 」這篇 Nature 上的文章指出,雖然 o1 在很多考試中贏過博士級的考生,但其實這個模型的「幻覺」(hallucination)比前幾代單純的 LLM 更加嚴重。這個產品與其拿來引導新手,毋寧更適合作為專家的助手(因為專家才能辨別AI 錯誤的部份加以修正)。

LLMs Still Can't Plan; Can LRMs? A Preliminary Evaluation of OpenAI's o1 on PlanBench」這篇研究直接拿 o1 來做 PlanBench(一個專門用來測試 LLM 規劃與推理能力的題庫),結果發現雖然在成績上比起 LLM 有大幅提昇,但其實依然不夠好,要號稱「大型推理模型」(Large Reasoning Model, LRM)似乎還需要一些努力。


是的,我是「LLM 通往 AGI」的唱衰者,它頂多是 AGI 的使用界面。我相信 LLM 是很有用的工具,但它絕對不是一個「萬能問答機」,除非你不在乎它會答錯。或許是我對機器的要求比較高,但如果我們不在乎會錯,那隨便問個人類就好了,至少你還可以把責任推給對方呢。

2024/09/27

這三年(二)一百首詩的實驗:智慧有限

大約在2020年下半,我開始了一個新的實驗,建立了一個全自動的系統,自動摘要前一天網路上的熱門話題,以此話題寫詩,然後發表在網路上。

這個系統在每天凌晨的時候,會自動上 PTT 八卦板找「24小時內回應最多的文章」,然後丟給「內容分析」的系統,找出「主題」跟相關的「文字脈絡」;這些主題跟文字,再丟給語言模型(當時用的是「用知名小說家作品集微調過的 GPT-2」),生成幾首詩;最後,再用生成的詩丟給「文字生成影像」的模型來生成圖片(當時 MidJourney 還是邀請制,我用的是 open source 的 ImageGAN),最後形成有圖有字的文章。

這個系統執行了100多天的成果,我放在「智慧有限」網站,當然,現在看起來這個系統沒什麼了不起,但想像一下,這個系統上線的時間比 ChatGPT 要早了一年多,所以技術含量也不是那麼的低。網站系統上有時間戳記,所以我也不用為先後順序多做解釋了。

記得當時給一些朋友看,大部分人的反應都是:「喔,那這可以拿來幹嘛?」不過在 GenAI 元年的現在,大概就不會有人這麼問了。

其實相同的系統架構,把 GPT-2 換成現在的 LLM(llama3, qwen2.5, ... etc.),立刻可以變身成為輿情分析、新聞摘要,甚至可以作到一定程度的導覽或策展(curate)。我相信這是目前很多單位在從事開發的目標。


回顧整個計畫執行過程中,我個人覺得比較有趣的部份有兩點。

第一個是「語言模型微調」的實務,這個題目目前是顯學,相關著作很多,像是前幾天剛出版的 "Build a Large Language Model (From Scratch)",基本上就跟我當時的工作日誌裡紀錄的流程差不多,只是當時靠著 RTX-2080 勉強可以微調 GPT-2 模型,要從頭訓練可能就力有未逮了。

第二是「詩該怎麼寫」。要知道 GPT-2 的「體積」是目前主流 LLM 的幾萬分之一,甚或更小(我用的是 small 的版本),能連續生出300字通順而且不偏離主題的內容,就很偷笑了,自然不可能像現在的 chatGPT 一樣直接命令它寫一首詩,還能寫得有模有樣。

然而恰恰因為如此,我們剛好可以實驗各種理論流派對詩的結構的定義。舉例來說,連續的兩句詩句,是要用連續生成的文句,還是用兩次生成的內容之中,語意相關性高,但又不是最高的句子?甚或是,我們該用多個不同版本的微調,對同一主題、相同脈絡進行文字生成,然後再做重組?(就是現在所謂的 MoE)

如此一來,文學似乎出現了一絲契機,可以成為一門實驗科學。這是今天用 GPT-3 以後的大語言模型,反而沒辦法做到的事情。

當然,這只是我個人覺得有趣而已,把文學做成了科學,一則不怎麼浪漫,二則也不見得有什麼實質的意義。

然後,這幾年還做了很多工作,試圖讓 machine learning 可以更恰當的作為一種科學研究的工具,這個部分就留待後續吧。


2024/09/22

這三年(一)

 

by bing image creator

日前(2024-09-21)貼了一篇新貼文,分享最近讀的書,再看看前一篇的時間,是 2021-10-20。差不多有三年沒有貼文了。說實話,在這之前貼文的速度就已經明顯變慢了,這種程度的怠惰,好像也不能都簡單推給新冠疫情,那麼就來稍微盤點一下這三年都在幹些什麼。

其實這三年之間,陸續有起草了多十多篇文章,但都不了了之。其中最多的是 AI 的相關文章,因為這個議題的熱門,我的工作量大增,相關的靈感也多;但另一方面領域進展得太快,以至於每一篇都是還沒寫完,就又有新的突破,或是別人寫了相似主題的文章,所以也就只能放著了。

例如:『該如何打造一個自動交易的機器人?』系列,算是前一個階段創業(2016)的一些心得,但後來跟私募基金簽了合約,就不能公開了;而這兩年,以這個主題開課、寫書的所在多有,我也就不擋人財路了。

『在人工智能浪潮下,其他專業領域的生存之道』跟『敵人還是朋友?機器學習與科學研究』兩篇是寫在 chatGPT 公佈之前,後來有 Machine Learning for Science (ML4Sci) 這類社群的出現,表示某種程度上表示不少人都意識到了這個問題,加上主要研討會(e.g., AI for Science: from Theory to Practice)、大廠(e.g., Google's Science AI)都陸續聚焦在這個議題上,似乎也就沒我什麼事了。

然後,2021 年中上線了一個花了一年時間做出來的系統,但隨著年底 chatGPT 的發表,也就變成了昨黃花,這個下一篇再說好了。(果然很懶惰)


2024/09/21

[Books] 近代的武林軼事與科學觀點的傳統武術,老衲的「說說八卦的八卦」

 


書名:說說八卦的八卦

作者:老衲

出版社:致出版


蠻有趣的書,總長度不長,每段篇幅適中,工作中有個五分鐘空檔就可以翻開讀上一篇,大約一個禮拜讀完,也是趣味橫生,頗有所得。

書中章節的編排也挺有趣,一篇作者講他對傳統武術的理解跟詮釋,跟著一篇近代武林的軼事(看書名當然是以八卦門為主軸囉),夾雜著看,倒也是挺有趣的體驗。

作者本身是「老衲的心意六合拳」的版主,由行文的風格和內容推測,約莫是中年以上,從小因家庭背景而學習國術的男性,用科學原理梳扒起傳統武術的根理脈絡,讓我這個兒少時因好奇而摸過一點點邊的門外漢,讀起來覺得是頭頭是道。

武林軼事主要是以「八卦門是怎來的」為主,當中的宮寶田就是電影一代宗師》裡的八卦門掌門,然後夾雜的國術雜談裡,也巧妙的介紹了太極、詠春、八極拳的一些拳理,相當有意思。

對傳統武術有興趣的人,推薦一讀;其實作者的其他作品我也都買了,就是不知道何時才有空讀了。